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tic des maladies a repetition trinucl^otidique. 
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La presente invention conceme la mise en evidence de genes humains 
comportant des sequences a triplets repetes CAG/CTG ou CGG/GCC, ainsi que 
I'utilisation de ces genes dans le diagnostic et I'eventuel traitement de certaines 
maladies monogeniques ou maladies polygeniques a composante hereditaire. 
5 Le polymorphisme anormal de sequences a triplets repetes CAG/CTG ou 

CGG/GCC constitue une mutation impliquee dans au moins dix maladies humaines 
hereditaires (appelees maladies a triplet repete) qui sont principalement, mms non 
exclusivement, des maladies neurodegeneratives. L'expansion (plusieurs triplets 
sumumeraires chez les malades) de sequences a triplet repete CAG/CTG est 
10 impliquee notamment dans 1' atrophic spinobulbaire (SBMA), la dystrophic 
myotonique (DM), I'ataxie spinocerebelleuse (SCA) SCAl, SCA2, SCA3, et 
SCA6, ratrophie dendato-rubro-pallydoluysiane (DRPLA). et la maladie de 
Huntington (1 a 3) L'expansion de sequences a triplet repete CGG/GCC est 
notamment impUquee dans le syndrome du X fragile (1). Enfin, le polymorphisme 
15 restraint de sequences a triplet repete CAG/CTG (par exemple un seul triplet 
sumumeraire chez les malades) est notamment impliquee dans la maladie de 
Beh9et, une maladie autoimmune pour laquelle le passage de 5 a 6 codons GCT 
codant pour une polyalanine est associe a la maladie (4). 

L'expansion des CAG/CTG ou CGG/GCC (appelee egalement mutation 
20 dynamique) est souvent associee a un phenomene d'anticipation, la taille des 
repetitions etant souvent correlee de fa9on inverse avec I'age de la survenue et/ou 
la severite des symptomes. 

L'expansion des repetitions CAG/CTG peut apparaltre dans les regions 
non codantes (DM) ou codantes (par exemple SBMA, HD. DRPLA, SCAs) des 
25 transcrits. Ces transcrits sont parfois exprimes dans les tissus autres que le cerveau 
et lorsqu'ils sont traduits conduisent a des produits de genes plus grands et portant 
un domaine polyglutamine anormalement allonge (1 a 3). 

L'expansion de triplets repetes CAG/CTG peut etre tres 
importante (par exemple DM ; plusieurs centaines de triplets), moderee (par 
30 exemple HD ou SCAl ; en general plus de 35 triplets), voire 
tres moderee (par exemple SCA6 ; en general moins de 35 
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triplets). A I'etat normal, ces repetitions peuvent etre hautement polymorphiques 
(par exemple HD ou SCAl) ou faiblement a tres faiblement polymorphiques (par 
exemple SCA2 et SCA6) (1 a 3). Une variation d'un seul triplet a I'interieur d'un 
triplet repete court et faiblement polymorphique peut aussi causer une maladie (4). 
5 La mise en evidence d'expansion CAG/CTG dans 1' ADN genomique de 

patients (5) et/ou I'anticipation dans les families a risque a suggere que les 
mutations dynamiques sont impliquees dans SCA4, SCA5, I'ataxie cerebrale 
dominante autosomale (ADCA de type 2, aussi designee sous le sigle SCA7), et 
dans les forme familiales de la psychose maniaco-depressive (PMD) et de la 
10 schizophrenic (6. 7). Dans le cas de SCAT, la mise en evidence d'expansions de 
polyglutamine a suggere que le triplet repete implique est du type triplet r6p6t6 
CAG dans une region codante (8). 

L'autisme et la demence familiale qui montrent des variabilites dans I'age 
de la survenue ou dans la severite des symptSmes pourraient egalement are 
1 5 causees par des mutations dynamiques. 

Un assez grand nombre de maladies pourraient egalement avoir pour 
origine ou impliquer des mutations dynamiques 
la maladie de Parkinson, 
les paraplegics spastiques, 
20 - les ataxies cerebrospinale non repertoriees precedemment, 

les cataractes zonulaires, 
les tremblements incontrolables, 
les neuropathies amyloides familiales, 
les arthrites granulomateuses familiales (maladie de Blau), 
25 - les microsomies hemifaciales, 

certaines anemies et glaucomes, 
les desordres obsessionnels. 
Ce qui precede demontre 1' importance considerable des triplets repetes 
pour le diagnostic et le traitement de plusieurs maladies. 

30 
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La presente invention repose sur une etude systematique des repetitions 
CAG/CTG ou CGG/GCC (qui seront ci-apres designees par "[CAG]n" et "[COG] 
n" respectivement, n etant le nombre de repetitions du triplet), cette etude ayant ete 
realisee avec des banques d' ADNc humains, celles-ci ayant subi un premier criblage 
general, puis les sequences retenues ayant ete selectionnees sur la base d'un certain 
nombre de criteres permettant de s'assurer que les sequences en cause 
appartenaient a de nouveaux genes humains et pouvaient, avec une grande 
probabilite, etre impliquees dans des maladies a triplet repete. Enfin, les sequences 
selectionnees ont fait Fobjet d'une etude plus complete destinee a permettre leur 
localisation. 

Dans le cadre de la presente invention, deux ensembles d' ADNc provenant 
de cerveaux humains ont ete etudies pour analyser la presence de repetitions CAG 
en utilisant 1' hybridation d*oligonucleotides sur des membranes a haute densite. Les 
deux librairies ont ete obtenues a partir de ARNms a Faide d'amorce oligo-dT, 
Tune des librairies etant constituee de clones d'ADNc de cerveau foetal (FB) et 
I'autre librairie etant constituee de clones d'ADNc normalises de cerveau de 
nouveau-ne (NIB). 

De fa(jon generale, la presente invention repose sur la mise en evidence de 
certaines sequences susceptibles d'etre impliquees dans les maladies a triplet repete 
obtenues dans des conditions d' hybridation permettant de selectionner des ADNc 
qui contiennent un nombre de sequences [CAG] ou [CGG] superieur a 7, lesquelles 
sont plus susceptibles d'etre polymorphes dans une population malade. 

Les conditions completes d'analyse et de selection de ces differentes 
sequences ne seront pas detaillees ci-apres, seuls seront foumis les elements 
permettant de les localiser et de les reisoler grace, notamment, aux amorces PGR 
qui seront decrites ci-apres. 

Plus particulierement, la presente invention concerne une sequence d' ADN 
transcrit riche en triplet repete CAG/CTG ou CGG/GCC correspondant aux 
sequences A a L du tableau, ainsi que leurs alleles normaux et mutes et les 
sequences complementaires. 




I 
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Par "alleles normaux" on entend designer les alleles tels qu'ils ont ete 
isoles ou tels qu'il peuvent etre isoles de prelevements d'individus normaux, les 
"alleles mutes" etant les alleles des genes portant les sequences [CAG]n ou [CGG]n 
anormalement repetees. 
5 II est important de noter que, bien que certaines de ces sequences soient, 

totalement ou en partie, publiques, les sequences en cause sont pour la premiere 
fois identifiees comma faisant partie d'un gene pouvant presenter une mutation, 
lesdits genes n'ayant, par ailleurs, en eux-memes jamais ete decrits. 

Les sequences mises en evidence presentent des pourcentages 
10 d'heterozygotie (HTZ) tres variables allant de 0 a 0,75 %. Les sequences 
monomorphiques (pour lesquelles HTZ = 0) sont au moins autant susceptibles 
d'etre impliquees dans des maladies a triplet repete que les sequences polymorphes. 

Bien entendu, comme cela est mentionne precedemment, ces sequences 
sont identifiees dans le tableau et pourront, si besoin est, etre reisolees en utilisant 
15 les amorces suivantes : SEQ ID 1 a 24, les amorces 1 a 24 correspondant, par 
paire, aux sequences A a L mentionnees precedemment. 

Les sequences ainsi mises en evidence peuvent, tout d'abord, etre utilisees 
dans le cadre du diagnostic, et plus exactement d'un pronostic. En effet, comme un 
grand nombre de maladies ayant un support genetique, la mise en evidence de la 
20 presence d'une sequence presentant un nombre de repetitions anormal de triplet 
[CAG]n ou [CGG]n ne peut en elle-meme assurer de la survenue de la maladie, 
mais doit etre interpretee en fonction d'un ensemble d'autres informations pour 
permettre, soit un diagnostic tres precoce, soit eventuellement une surveillance 
specifique, surtout dans les families a risque. 
25 Ce diagnostic peut etre eflfectue en comparant la sequence d'ADN selon 

I'invention du patient avec une sequence normale pour detecter la presence de 
repetitions trinucleotidiques supplementaires. 

Plus particulierement, la presente invention conceme un precede 
de mise en evidence des risques d'apparition d'une maladie a 
30 repetition trinudeotidique chez un patient, caracterise en ce qu'on 
compare la sequence d'ADN conforme a I'invention dudit patient a 
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une sequence normale pour detecter la presence de repetitions trinucleotidiques 
supplementaires. 

Bien entendu, il existe un grand nombre de methodes qui permettent la 
mise en evidence de triplets sumumeraires par rapport a des sequences normales, 
5 par exemple il est possible de ntiettre en evidence des differences de poids 
moleculaires en utilisant des gels et une mahode de type RFLP. Mais, les methodes 
les plus efficaces consistent a pratiquer prealablement a la mise en evidence des 
differences une operation d'ampUfication, par toute methode appropriee, 
notamment la methode dite "PCR", meme si d'autres methodes sont utilisables. 
10 11 n'est pas necessaire ici de decrire en detail la methode PCR, celle-ci 

permet d' amplifier de faQon considerable une sequence specifique comprise entre 
deux sequences appelees "amorces". 

Parmi les amorces utilisables dans le cadre des procedes selon I'invention, 
il faut citer les amorces des SEQ ID 1 a 24 qui constituent deux par deux des paires 
1 5 d' amorces pour chacune des sequences objet de IMnvention. 

En utilisant les amorces decrites precedenmient, on amplifie les sequences 
selon la presente invention et il est alors possible, par comparaison avec un 
echantUlon normal et/ou etalon, de mettre en evidence la presence des triplets 
sumumeraires et done la possibilite de survenue d'une maladie liee a ce type de 
20 mutation dynamique. 

II est egalement interessant de noter que certaines maladies a triplet repete 
sont connues pour etre associees a des variations moderees a tres faibles du nombre 
de triplets repetes, comme par exemple, SCA6 et la maladie de Beh9et. Dans ces 
conditions, la methode diagnostic peut permettre, non seulement un bon pronostic 
25 de la survenue de la maladie, mais egalement d'evaluer le moment ou cette maladie 
surviendra et/ou son eventuelle severite. 

La presente invention conceme egalement les genes et leurs alleles qui 
portent, au moins en parties, ces sequences, lesdits genes etant, bien entendu, 
impliques directement dans la survenue de la maladie. 

30 
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Elle a egalement pour objet une cellule transformee exprimant tout ou 
partie des susdits genes, une proteine obtenue a partie d'une telle cellule, une 
proteine interagissant avec la proteine precedemment mentionnee ainsi qu'un 
vecteur exprimant I'une de ces proteines. 

Les genes correspondant pourront Stre exprimes dans des cellules par des 
moyens connus afin de produire les proteines correspondantes. 

11 est possible d'envisager I'utiHsation desdites proteines dans certains kits 

de diagnostic par exemple. 

De fa9on generale, ces proteines etant impliquees dans la maladie, on 
souhaitera en diminuer la quantite, soit en bloquant leur expression par des 
methodes appropriees au niveau des genes ou des elements de regulation, soit en 
les fixant ou en les inactivant, par exemple en utiUsant des proteines receptrices 
jouant le role de leurres. La encore, ces proteines receptrices ou inactivees pourront 
etre generees in situ par expression des sequences d' ADN correspondantes. 

II est egalement possible de prevoir la realisation d'anticorps monoclonaux 
correspondant a ces proteines afin d'envisager le blocage desdites protdnes lorsque 
cela est souhaite, I'ensemble de ces operations pouvant etre realise directement in 
vivo par exemple, en utilisant des techniques de therapie genique, en particulier en 
utilisant des vecteurs qui porteront les sequences d' expression des genes. 

On a mis en evidence le fait que les proteines presentant des domaines 
polyglutamines anormalement etendus avaient des proprietes d'aggregation 
anormales, tant entre elles, qu'avec d'autres proteines (11,12). Les aggregats ainsi 
crees sont probablement impliques dans la genese des maladies a triplet repete, 
c'est pourquoi il est egalement possible de prevoir une therapie dans laquelle les 
agents therapeutiques viendraient empecher I'aggregation, soit en bloquant la 
molecule comme decrit precedemment, soit en se fixant a la molecule pour 
empecher le rapprochement avec d'autres proteines. 

On peut, dans le cadre de la therapie, prevoir d'utiliser des variants 
complets ou deletes de ces proteines, normales ou non (quant au domaine [CAG]n 
ou [CGG]n). 
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Les sequences selon la presente invention peuvent etre obtenues grace aux 
informations figurant au tableau et aux references qui y sent donnees et en utilisant 
les sequences d'amorce qui sont decrites dans les identificateurs de sequence ci- 
joints. 

5 Les deux librairies utilisees sont : 

une premiere librairie (5) contenant 60 000 ADNc 
non normalises de cerveau foetal humain (clones FB) (Laboratoire du 
Dr. Hans Lehrach, Max Plank Institute for Molecular Genetics, Berlin, 
Allemagne) sous-clones dans le vecteur p-SPORT-1 (Life 
1 0 Technologies, Inc., Gaithesburg, MA, USA), et 

la seconde librairie contient 40 128 ADNc normalises 
de cerveau de nouveau-ne (clones NIB) sous-clones dans un vecteur 
lafmid (6) et qui est une partie des ressources du consortium IMAGE 
(Lawrence Livermore Lab., Livermore, CA,) et du programme EST 
1 5 Merck WU (Washington University, St-Louis, LO, USA). 

D' autre part, un certain nombre d'autres informations ont ete recueillies en 
utilisant Genbank Database (NCBI Bethesda, MA, USA). 

Les methodes de selection et d' analyse qui ont ete mises en oeuvre ne font 
pas en elles-memes partie de la presente invention puisque Tinvention a 
20 essentiellement pour objet les sequences ainsi obtenues et leur utilisation, 
notamment, dans des methodes de diagnostic ou des methodes de traitement 
therapeutique. 

Dans la presente analyse, on a retenu, non seulement les sequences 
[CAG]n ou [CGG]n parfaites, mais egalement les sequences [CAG]n ou [CGG]n 
25 complexes, c'est-a-dire celles qui sont ponctuees par des insertions de triplets ; en 
effet cette presence de triplets inseres s'observe notamment dans le cas de SCAl, 
alors que tel n'est pas le cas pour SBMA, MD et HD. 

D'autre part, les nouveaux clones selectionnes a partir de librairies NIB 
sont distincts de ceux selectionnes dans le groupe FB. Ceci est en accord avec le 
30 fait que le cerveau humain exprime un grand nombre de genes distincts a des stades 
de developpement differents. 
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Enfin, des presentes observations il ressort que des sequences [CAG]n ou 
[CGG]n sont rares dans les ADNc humains representatifs des regions 3' des 
ARNm. 

Bien que dans I'etat actuel de la presente invention, les sequences qui 
5 constituent I'objet de I'invention n'aient pas ete reliees directement a des affections 
hereditaires, la presence d'extensions anormales CAG ou CGG peut etre reliee avec 
le risque de survenue d'une maladie, en particulier lorsqu'il y a une composante 

familiale. 

11 existe un assez grand nombre de maladies qui actuellement n'ont pas ete 
10 localisees at trouveront probablement a etre reliees avec les sequences selon la 
presente invention. 

Parmi les elements additionnels qui ont ^e pris en compte pour etudier la 
pertinence des sequences retenues figure I'existence eventuelle d'un cadre de 
lecture ouvert (ORF) dans lequel les sequences [CAG]n ou [CGG]n codent pour 
1 5 une extension polyglutamine. 
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< 



Localisation 


so 


Nombre d'alleles 
(nombre de triplets) 


o 1 


Heterozygotie 


aucune 

aucune 

aucune 

aucune 

aucune 

0.025 

0.75 

aucune 

aucune 

0.675 

aucune 

aucune 


Triplet 5^3' 


o 

o 


Nom du clone 
(CEPH) 


1.45 
2.52 
2.99 
2.122 
3.58 
1.10 

i.34 

i.lll 

i.l29 

1.85 

2.296 


Sequence 
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LISTE OE SEQUENCi^S 

(1) INFORMATIONS GENERALES: 

(i) DEPOSANT: 

(A) NOM: FONDATIGN JEAN DAUSSET 6 CENTIME D' ETUDES DU 

POLYMORPHI5ME HUMAIN (CEPH) 

(B) RUE: 27 RUE JULIETTE DOOU 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 7 5010 

(ii) TITRE DE L' INVENTION: SEQUENCES D'AON RICHES EN TRIPLET REPETE 
UTILES DANS LE DIAGNOSTIC DE MALADIES A REPETITION 
TRINUCLEOTIDIQUE 

(iii) NOMBRE DE SEQUENCES: 2 4 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEMS D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentin Release Sl.O, Version »1.30 (OEB) 

(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vii) SOURCE IMMEDIATE: 

(A) aiBLIOTHEQUE : Max Plank Institute for r:oiecL:lar Genetics, 

Laboratory of Or nans Lehrach. d-^rlir., Alie:r.agne 

(B) CLONE: ICRFp507K15223 

( ix) CARACTERISTIQUE : 

(A) NOM/CLE: 1.45 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

CGCTCCTTCC TCTCAAG 17 

(2) INFORr-L^^TIGNS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 13 paires de bases 
(3) TYPE: nucleotid-5 

(C) NOMBRE DE BRIMS: sinole 
•;D) CONFIGURATION: lineaire 

(ii) TYPE OE MOLECULE: ADNc 

<vii) SOURCE IMMEDIATE: 

(A) 3IBLIOTHEQUE: Ha:< Plank InSwitute for ^•oiecuiar Genetics, 

Laboratory of Dr hans Lehrach, Berlin, Aliemagne 
CB) CLONE: ICRFp507K15223 
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(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 1.4 5 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 
CTCAGCATCG GGTAAAAG 

(2) INFORMATIONS POUR LA SEQ I D NO : 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Geneti 

Laboratory of Dr bans Lehrach, Berlin, Allemaane 

(B) CLONE: ICRrp507M22190 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 2.52 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 
CTACAACAGA AATTCCGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(il CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: Iineaire 

(ii) TYPE DE MOLECULE: ADNc 



(Vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Geneti 

Laboratory of Dr bans Lehrach, Berlin, Allenagne 

(B) CLONE: ICRFp507M22 1 90 

( ix) CARACTERISTIQUE: 

(A) NOM/CLE: 2.52 



(:-:i) DESCRIPTION DE LA SEQUENCE: SEQ ID :;0 : A: 

:2) IN FORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: Iineaire 

(ii) TYPE DE MOLECULE: ADNc 



• 
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(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Genetics 

Laboratory of Or hans Lehrach, Berlin, Allemaqne 

(B) CLONE: ICRF p507F12249 

( i X ) CARACTERI ST IQUE : 

(A) NOM/CLE: 2.99 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 
CATGGGGTTG CCGAAGAGGA G 21 
(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
(0) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Genetics 

Laboratory of Or hans Lehrach, Berlin, Allemaqne 

(B) CLONE: ICRFp507 F1224 9 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 2.99 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
CGCCCTTCTG GAAGGCTCAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Genetics, 

Laboratory of Dr hans Lehrach, Berlin, Allemaqne 

(B) CLONE: ICRrp507C15296 

vi::) CARACTERISTIQUE: 

(A) NOM/CLE: 2.122 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 
TGGCAGAATG GATTTGTG 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 19 paires de bases 
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(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Genetics. 

Laboratory of Or hans Lehrach, Berlin, Allemaqne 

(B) CLONE: ICRPp507Cl 5296 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 2.122 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 
CCATCTTGAA GAAGTACTT 

(2) INFORMATIONS POUR LA SEQ 10 NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Genetics, 

Laboratory of Or hans Lehrach, Berlin, Allemaane 

(B) CLONE: ICRFp507L13l77 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 3.53 



(xi) DESCRIPTION DE LA SEQUCNCE: SEQ ID NO: 9: 
TCACTCCTCC ATTGTCTGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE OE BRINS: simole 

(D) CONFIGUR-^TION: lineaire 

(ii) TYPE DE MOLECULE: AD^Jc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Ma>: Plank Institute lor Molecular Genetics. 

Laboratory of Or hans Lehrach, Beriir., Aiiemaane 

(B) CLONE: ICRFp507L13177 

( ix) CARACTERISTIQUE : 

(A) NOM/CLE: 3.58 



(Xi) DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 10: 
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CTGTCCGAGG AGGTATCG 16 
(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOM3RE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE : Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 35570 

( i X ) CARACTERISTIQUE : 

(A) NOM/CLE: i.lO 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
ACCTTGTCCA GTCCATTG 18 
(2) INFORMATIONS POUR LA SEQ I D NO : 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C> NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrer.ce Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 35570 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: i.lO 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

GTTGTCTTTA TAAAACACAG A 21 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(X) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 17 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: siir.ple 
(0) CONFIGURATIOM: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Liverxore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 43014 
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( ix ) CARACTERISTIQUE : 

(A) NOM/CLE: i . 12 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
CCCA^^GTCCC ACAATAG 17 
(2) INFORMATIONS POUR LA SEQ ID NO: lA : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E,, Lawrence Livermore National 
Laboratories, Livermore, CA« USA. 

(B) CLONE: 43014 

( i X) CARACTERISTIQUE : 

(A) NOM/CLE: i . 12 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 
GCGTCAGTGG CAGAAG 16 
(2) in FORMAT IONS POUR LA SEQ 10 NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 
(3) CLONE: 54662 

( i X) CARACTERISTIQUE : 

(A) NOM/CLE: i . 34 



(:-:i) DESCRIPTION DE LA SE':J'J=:NCE : SEQ ID NO: 15: 
T-TTTTA-TCAT CCTGGTTC IH 
2; INFORMATION'S POUR LA SEO 10 MO: 16: 

(il CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simole 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE: ADNc 
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(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 54662 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 1.34 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 
TGTGTTAGGT CCTAGAAG 18 
(2) INEORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : Simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence. Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 42315 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: i.lll 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ 10 NO: 17: 
CCTCCAGCAG GGTATGGC 18 
(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E,, Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 42315 

( i;:J CARACTERISTIQUE: 

(A) NOM/CLE: i.lll 



(:<i) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

CGAACGGACC TGGGAACTG 19 

t2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 18 paires de bases 
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(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE: ADNc 



(Vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 52900 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 1.129 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 
TCTGCCCCTG GAGGTGGG 18 
(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 27 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: Iineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore. CA, USA. 

(B) CLONE: 52900 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: i . 129 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 
CTTCACTGGC GCTTTTTCTT CAGCTTC 2 7 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE: AON'c 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Instic---- iDr X:,^ iocu la r GeneticG. 

Laboratory of Or hans Lehracn, lierlir., Aiiemagne 
(3) CLONE: ICRFp507?04 169 

( ix) CAR-CiCTERISTIQUE : 

(A) NOM/CLE: 1.85 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
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GAACAGCCTA TCTCATTCC 

(2) INFORMATIONS POUR LA SEQ ID NO: 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 32 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
(O) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Genetics, 

Laboratory of Dr hans Lehrach, Berlin, Allemagne 

(B) CLONE: ICRFp507 P04 1 188 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 1.8 5 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 
TCAGAAGTAA CTTGAATAAA TAATCATATT CG 

(2) INFORMATIONS POUR LA SEQ ID NO: 23:' 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Instituto :or Xoiecuiar Genetics, 

Laboratory of Or hans Lehrach, Soriir. , Allemagne 

(B) CLONE: ICRrp5073162 62 

(i:-:) CARACTERISTIQUE: 

(A) NOM/CLE: 2.296 

(>;i) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 

CACTTGGAAT CCACAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 16 paires de bases 
(3) TYPE: nucleotide 

(C) NO>:3RE DE 3RIS5: simple 

(D) CONFIGURATIOM: lineaire 

(iij TYPE DE MOLECULE: AONc 



(vii} SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Ma>: Plank Institute for MoLocular Genetics. 

Laboratory of Dr hans Lehrach, Berlin, Allemagne 
(3) CLONE: ICRFp507316262 
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(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 2.296 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 
AGAGATCCTG AAGGAC 
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ttFVFTsJDTCATIONS 

1) Sequence d'ADN transcrit riche en triplet repete CAG/CTG ou 
CGG/GCC correspondant aux sequences A a L selon le tableau ainsi que leurs 

5 alleles normaux et mutes et les sequences complementaires. 

2) Sequence d'ADN, caracterisee en ce qu'elle porte au moins en 
partie une sequence selon la revendication 1 

3) Precede de mise en evidence des risques d'apparition d'une 
maladie a repetition trinucleotidique chez un patient, caracterise en ce qu^on 

10 compare la sequence d'ADN selon la revendication 1 dudit patient a une sequence 
normale pour detecter la presence de repetitions trinucleotidiques supplementaires. 

4) Procede selon la revendication 3, caracterise en ce qu'on effectue 
une amplification de tout ou partie des sequences selon la revendication 1 et que 
Ton met en evidence dans le produit d' amplification la presence de repetitions 

1 5 trinucleotidiques supplementaires 

5) Procede selon la revendication 4, caracterise en ce que 
r amplification des sequences est effectuee avec les amorces decrites SEQ ID 1 a 24 
correspondant aux sequences A a L respectivement. 

6) Cellule transformee exprimant tout ou partie d'un gene selon la 

20 revendication 2. 

7) Proteine obtenue a partir d'une cellule transformee selon la 

revendication 6. 

8) Proteine interagissant avec une proteine selon la revendication 7. 

9) Anticorps monoclonal correspondant a une proteine selon Tune 

25 des revendications 7 ou 8. 

10) Vecteur exprimant une proteine selon Tune des revendications 7 

ou8. 

1 1) Utilisation d'une proteine selon I'une des revendications 7 ou 8, 
d'un anticorps selon la revendication 9 ou d'un vecteur selon la revendication 10 

30 pour la preparation d'un medicament. 
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